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Résumé. Les gros codes de calcul sont souvent utilisés en ingénierie pour étudier des 
systèmes physiques. Cependant, les simulations peuvent parfois être coûteuses en temps 
de calcul. Dans ce cas, une approximation de la relation entrée/sortie du code est souvent 
faite à l'aide d'un méta- modèle. En fait, un code de calcul peut souvent être lancé à 
différents niveaux de complexité et une hiérarchie de niveaux de code peut donc être 
obtenue. Il peut s'agir par exemple d'un modèle éléments finis ayant un maillage plus 
ou moins fin. L'objectif de nos travaux est d'étudier l'utilisation de plusieurs niveaux de 
code pour prédire la sortie d'un code coûteux. Le méta-modèle multi-niveaux présenté 
ici est un cas particulier du co-krigeage. Après avoir détaillé le modèle de co-krigeage 
utilisé et sa mise en place, nous concentrerons notre présentation sur les stratégies de 
planification d'expériences séquentielles. En effet, un avantage du co-krigeage est qu'il 
fournit, au travers de la variance de co-krigeage, une estimation de l'erreur de modèle 
en chaque point de l'espace des paramètres d'entrée. Ainsi, pour améliorer la précision 
du méta-modèle on peut enrichir séquentiellement notre base d'apprentissage aux points 
où la variance est la plus grande. Cependant, dans un cadre de multi-fidélité, il faut 
également choisir sur quel niveau de code on veut connaître la réponse. Nous présenterons 
ici différentes stratégies pour choisir ce niveau basées sur un résultat original qui donne 
la contribution de chaque code à la variance de prédiction du modèle. 

Mots-clés, co-krigeage, méta-modélisation multi-fidélité, plan d'expériences, stratégie 
séquentielle. 



Abstract. Large computer codes are widely used in engineering to study physical 
Systems. Nevertheless, simulations can sometimes be time-consuming. In this case, an 
approximation of the code input/output relation is made using a metamodel. Actually, a 
computer code can often be run at différent levels of complexity and a hierarchy of levels 
of code can hence be obtained. For example, it can be a finite élément model with a more 
or less fine mesh. The aim of our research is to study the use of several levels of a code to 
predict the output of a costly computer code. The presented multi-stage metamodel is a 
particular case of co-kriging which is a well-known geostatistical method. We first describe 
the construction of the co-kriging model and we focus then on a sequential expérimental 
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design strategy. Indeed, one of the strengths of co-kriging is that it provides through 
the prédictive co-kriging variance an estimation of the model error at each point of the 
input space parameter. Therefore, to improve the surrogate model we can sequentially 
add points in the training set at locations where the prédictive variances are the largest 
ones. Nonetheless, in a multi-fidelity framework, we also have to choose which level of 
code we have to run. We présent here différent stratégies to choose this level. They are 
based on an original resuit which gives the contribution of each code on the co-kriging 
variance. 

Keywords. surrogate models, co-kriging, multi-fidelity computer experiment, expéri- 
mental design, sequential strategy. 

1 Introduction 

Le krigeage est une classe particulière de méta-modèle qui fait l'hypothèse a priori 
que la sortie que l'on essaye d'approcher est une réalisation d'un processus Gaussien. On 
se concentre ici sur ce modèle et son extension pour les sorties à réponses multiples. Le 
lecteur pourra se référer aux livres de Santner, Williams et Notz (2003) et Rasmussen et 
Williams (2006) pour plus de détails sur le krigeage. Dans le cadre des simulateurs multi- 
fidélités, nous possédons un code qui peut être lancé à plusieurs niveaux de précision. 
Ces niveaux pouvant par exemple correspondre à différentes tailles de mailles pour un 
code éléments finis. L'objectif de la méta-modélisation sera de construire une surface de 
réponse du code en utilisant une ou plusieurs de ses versions dégradées. 

Un premier méta-modèle multi-niveaux a été mis en place par Kennedy et O'Hagan 
(2000) en utilisant une relation autorégressive d'ordre 1 entre deux niveaux successifs. Ce 
modèle est un cas particulier du co-krigeage qui est une méthode communément utilisée 
en géostatistique. Ensuite, Qian et Wu (2008) ont proposé une approche Bayésienne du 
modèle suggéré par Kennedy et O'Hagan (2000) et Forrester, Sobester et Keane (2007) ont 
présenté l'utilisation du co-krigeage dans un cadre d'optimisation (basée sur l'algorithme 
EGO : Efficient Global Optimization). Enfin, certains points limitant de la méthode ont 
été résolus dans le papier Le Gratiet (2011) qui présente entre autres une procédure 
d'estimation efficace des paramètres, une réduction de la complexité du modèle et une 
nouvelle approche Bayésienne évitant une implémentation prohibitive. Dans les papiers 
ci-dessus, différentes méthodes de planification d'expériences ont été proposées mais aucun 
auteur ne s'est intéressé à la planification d'expériences séquentielle. Pourtant la hiérarchie 
de codes disponible peut nous permettre de mettre en place des stratégies intéressantes 
de planification séquentielle. La question sera la suivante : si nous voulons lancer une 
simulation en un nouveau point, sur quel niveau de code allons-nous la lancer? Il va donc 
falloir trouver le meilleur compromis coût / précision et nous allons pour cela utiliser un 
résultat utile déduit de Le Gratiet (2011). 
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2 Construction du méta-modèle multi-fidélité. 



Nous présentons ici une nouvelle modélisation multi-niveaux qui est équivalente à celle 
proposée par Kennedy et O'Hagan (2000) et qui se construit de manière récursive. 

2.1 Rappels des équations du modèle AR(1) étendues au cas s 
niveaux. 

Supposons que nous ayons s niveaux de code modélisés par des processus Gaussiens 
(Z t (x))t=i t ... tS , x E Q, classés par ordre croissant de précision et tels que : 

Z t (x) = /Ot_i(a;)Z t _i(a:) + 8 t (x) 

Zt-^x) JL 6 t (x) (1) 
Pt-i(x) = gj-.iix)^-! 
où l'on définit Vt = 2, . . . , s : 



ô t {x)~VÇ{ff{x)hrfr t {x,J)) (2) 



et 



Zi(x) ~ VGifl (x)f5 1 ,air 1 (x,x')) (3) 



On fait donc ici l'hypothèse a priori que les sorties des codes sont des réalisations de 
processus Gaussiens. Le méta-modèle sera construit en conditionnant ces réalisations par 
les sorties connues des codes. 

La modélisation précédente issue de l'article de Kennedy et O'Hagan (2000) définit la 
relation entre les niveaux de codes. Elle est déduite de l'hypothèse suivante : Vx, si on 
se donne la valeur de Z t -i(x), on ne peut rien apprendre de plus sur Z t (x) à partir des 
autres résultats Z t -i(x / ) pour x ^ x' . 

Soit Z = (Zj , . . . , Zj) T le vecteur Gaussien contenant le valeurs des processus (Z t (x))t=i t .. 
aux points des plans d'expériences (D t )t=i s avec D s Ç D s _i Ç ••• C D\. Si on note 
= (/3f,...,/3jf, (3 P = (/3j 1 ,...,/3j s _ l f,V 2 = K 2 ,...,a s 2 ) et z = (z\ . . . , z s ) les 
réponses connues des codes, on a : 

VxGQ [Z s (x)\Z = z,(3,P p ,a 2 ]~M {m Zs (x) , s\ (x)) 

où : 

m Zs {x) = h' s {x) T p + t s {x) T V s -\z - H s (3) (4) 

et : 

*z.(x) = oîAx) - t a (x) T VrH a (x) (5) 

La moyenne de co-krigeage mz a {x) constituera le méta-modèle sur le niveau le plus 
précis construit à partir des réponses connues sur les s niveaux de code et la variance de 
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co-krigeage s 2 Zs (x) donnera une estimation de l'erreur de modèle. 



La matrice V s représente la matrice de covariance du vecteur Gaussien Z, le vecteur 
t s (x) est le vecteur de covariance entre Z s (x) et Z, H s j3 est la moyenne de Z, h' s (x) T /3 
est la moyenne de Z s (x) et o\{x) sa variance. Tous ces éléments sont construits à partir 
du vecteur d'expériences au niveau t et de la covariance entre Z t (x) et Z t i{x') explicités 
ci-dessous : 



't-i \ /t-i 



,i=l / \i=2 



K(x) T = ^[llpiix) ) fi(x), ( Y[ Pi (x) ) g(x),..., Pt _ 1 (x)fl 1 (x)J^x) ) (6) 
et pour t > t' : 

cov(Z t (x),Z t ,(x')W 2 ,f3,P P ) = [ \\ Pi {x) ) cov(Z t ,(x),Z t ,(x')\a 2 ,(3,P p ) (7) 



't-i 



\i=t' 
avec : 

't-i 



cov(Z t (x),Z t (x')\a 2 ,(3,(3 p ) = ( ]Jp 2 (x) ) r^x') (8) 

j'=i 



2.2 Ecriture récursive du modèle AR(1) 

Nous allons ici présenter une nouvelle modélisation multi-niveaux qui est en fait 
équivalente à la précédente. Considérons la modélisation suivante pour t = 2, . . . , s : 

f Z t {x) = p^x^Z^x)^ = z*- 1 ] + S t (x) 

l Z t _ x (x) ± 6 t (x) (9) 

[ Pt-i(x) = gf-^x)^ 

avec D s Ç D s _i Ç • • • C D\. La seule différence avec la précédente modélisation est 
que l'on exprime Z t (x) (le processus Gaussien modélisant le code de niveau t) en fonction 
du processus Z t _i(x) conditionné par ses réponses connues z 1 ^ 1 sur le plan D t _\. Les 
{^t{x])t=%...,s sont définis comme précédemment et on a pour tout t = 2, . . . , s : 

[Z t (x)\Z t = z 1 ] ~Af(p Zt (x),s 2 Zt (x)) (fO) 

où : 

Pz t {x) = Pt-i{x)p Zt _M + f7(x){3t + rJ{x)Rl l {z 1 - p t _i(A) ^t-i(A) - FA) (11) 
et : 

4» = P* 2 -i(*)4*_» + »? (1 " rH^^^^x)) (12) 

Le symbole représente le produit matriciel élément par élément. Rt est la matrice 
de corrélation de D t avec le noyau r t (x,x') et rj(x) est le vecteur de covariance entre x 
et D t avec ce même noyau. On note p t (D t _i) le vecteur contenant les valeurs de pt(x) 
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pour x G Dt-x-, z t (D t -i) celui contenant les sorties connues de Z t (x) sur D t -\ et F t est la 
matrice d'expériences contenant les valeurs de ft(x) T sur D t . 

La moyenne fiz t ( x ) constitue le méta-modèle sur le code de niveau t sachant les 
réponses connues des t premiers niveaux de code et la variance s 2 Zt {x) représente l'er- 
reur de ce modèle. La moyenne et la variance de co-krigeage sur le niveau t s'exprimant 
à partir de celles du niveau t — 1, on a bien une expression récursive du modèle pro- 
posé par [2]. La modélisation proposée ici est puissante car elle montre que construire un 
co-krigeage à s niveaux est équivalent à construire s krigeages indépendants. 

3 Planification d'expériences séquentielle pour le co- 
krigeage 

La modélisation récursive présentée précédemment va nous permettre de construire 
une méthode simple de planification d'expériences séquentielle. Nous travaillerons sur un 
des principaux critères de planification séquentielle utilisés dans le krigeage : le MSE 
(Mean Squarred Error). La stratégie consiste simplement à trouver le point maximisant 
la variance de prédiction s'écrivant : 

4M = Pt-ifaR-» + (1 - rJ{x)RT l r t {x)) Vt = 2, . . . , s 
s 2 Zi (x)=al{l-r T l {x)R- l l r l {x)) 
Soit x = argmax x s% (x). On a alors Vt = 1, . . . , s : 

4 t (5) = pU(ï)s%^) + (1 - rJ{x)R^r t {x)) 
Supposons que l'on décide de lancer le code t — 1 en x, on a alors s z (x) = et : 

4 t {x) = o*(l-r'[(x)Rî 1 r t {x)) 

p 2 -x{x)s z (x) représente donc la part de la variance due au code de niveau t — 1 et 
of (l — rj (x)R^ l r t (x)) représente la part de la variance due au code de niveau t. Une 
stratégie naturelle de planification d'expériences est alors de trouver le point x maximi- 
sant la variance, de regarder la part de chaque niveau de code sur s% (x) et de lancer une 
simulation sur le niveau de code le plus intéressant (selon un critère coût /précision qui 
dépendra du cas d'application). 

Il est donc nécessaire de construire un critère qui nous permette de déterminer quel 
niveau de code est le plus intéressant. Nous illustrons dans ce résumé, une méthode pour 
choisir ce niveau dans le cas s = 2. On introduit pour cela la moyenne de la variance de 
prédiction (où fj,(x) représente la mesure de la loi des entrées) : 

Jq 
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Considérons x = argmax^. s% (x), dans le cas à 2 niveaux nous pouvons lancer soit 
Z\{x) soit Z2(x). Supposons que l'on connaisse Zi(x), on aura alors : 

s 2 Z2 (x) = a 2 2 (l - r^(x)R^r 2 (S:)) 

Si s z (x) < imse cela signifie que l'erreur de modèle en x est inférieure à l'erreur de 
modèle moyenne. Il n'est donc pas nécessaire de lancer le code de niveau 2 en ce point 
car cela n'apportera pas en moyenne plus d'information qu'un autre point. En revanche, 
si s 2 z {x) > imse, cela signifie que l'erreur de modèle en x est plus importante que l'erreur 
moyenne et il sera donc avantageux de lancer le code de niveau 2 en ce point. 
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